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[摘要 ] 选取 国外 10 所 大 学 的 图 书馆 作为 调查 对 象 ,运用 图 书馆 学 信息 分 析 与 预测 中 的 跟踪 扫描 与 信息 提炼 方法 ,从 管 
理 哪 些 科研 数据 、 如 何 管理 科研 数据 、 如 何 保障 科研 数据 相关 者 的 权益 最 大 化 三 个 方面 分 析 了 科研 数据 管理 的 政策 要 素 
内 容 。 研 究 结果 表明 ,在 e-science 环境 下 ,科研 数据 管理 是 图 书馆 未 来 发 展 的 趋势 ,我国 信息 服务 机 构 在 制定 科研 数据 
管理 政策 时 ,可 以 注重 科研 数据 存储 规范 (存储 义务 、 存 储 内 容 、 存 储 格式 ) .科研 数据 质量 管理 规范 (协助 创建 个 人 科研 数 
据 管 理 计 划 、 积 极 开展 培训 、 设 计 元 数据 标准 、 规 范 命名 格式 、 设 计 存 储 时 间 、 建 立 数据 库 ) 科研 数据 共享 规范 (引用 要 求 、 
使 用 许可 、 隐 私 保护 ) ,从 累积 实践 经 验 完善 数据 政策 以 及 政策 指南 。 
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[Abstract] By using scanning and information extraction method in information analysis and prediction field, this paper analy- 
zes the contents of research data management policies of the 10 universities’ libraries from three aspects—— what scientific 
research data should be managed, how to manage the scientific research data and how to maximize the rights of the stake- 
holders. The result shows that the research data management has become an inevitable tendency in the e-science environ- 
ment, and the information service organization should focus on the submitted standard (storage obligation, storage content, 
storage format) , data quality management norm (research data management plan, training, metadata standard, file name, 
storage time and data repository), and the share policy (quote requirements, license and privacy protection). Also, the in- 
formation service organization should to improve the data policies and policy guide in the practice. 


[Key words] Information service organization Research data Data storage Data quality Data sharing 


| ”科研 数据 管理 离 不 开 信息 服务 机 构 的 积极 实践 。 反映 客观 世界 的 本 质 、 特 征 、 变 化 规律 等 的 原始 基本 
b K 同 科技 活动 需要 ,进行 系统 
科研 数据 已 得 到 学 术 界 、 出 版 界 .图 书信 息 服务 S ARRENAR R ANRE ATRAI E 
i m DEI BA g 35 dim EU. WD ER SE (Research Data 
界 等 的 高 度 重视 ,已 有 若干 学 者 对 此 展开 讨论 cr 。 


PENA NNNM u Management, 以 下 简称 RDM) 包 括 数据 选择 、 组 织 、 描 
科研 数据 是 指 在 科技 活动 或 通过 其 他 方式 所 获取 的 。 述 、 保 存 . 访 问 、 使 用 和 评估 等 工作 过 程 、 实 践 操作 , 酒 
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盖 了 从 制定 标准 、 数 据 映射 至 不 同 仓储 到 元 数据 创 
建 、 语 义 注释 和 文献 链接 等 广泛 的 活动 ,处 理 后 的 数 
1E ECEIS (S 5 ES REGE 。 这 多 方面 的 RDM 强调 与 
外 界 环境 (政策 机构) 以 及 人 之 间 的 协调 号 。 

目前 ,国内 外 已 有 若干 研究 ,国外 如 Kim? 指出 
RDM 服务 可 以 增加 科研 人 员 对 自己 数据 的 管理 , Shen 
和 Virgil? 调研 了 美国 约翰 霍 普 金 斯 大 学 的 数据 知识 
库 的 实施 情况 , Stephen Kutay "分 析 了 科研 教育 机 构 
在 进行 数据 资源 管理 时 需要 注意 的 一 些 问 题 ,David 
soni" 引 分 析 了 目前 英国 正在 实施 的 数据 管理 项 目 ,著名 
信息 搜寻 行为 研究 者 Gary Marchionin 在 武汉 大 学 介绍 
了 iSchool 的 RDM ££ XU! ,Jelter 中 也 便 说 数据 共享 应 
该 是 规则 而 不 应 该 是 特例 ;国内 的 研究 主要 集中 于 国 
外 实践 管理 政策 的 归纳 总 结 ,如 顾 立 平 " 下 分 析 了 RDM 
中 的 权益 问题 , 吴 振 新 "5 对比 了 5 所 大 学 RDM 的 政 
策 , 吴 新 年 "7 AB AT RDM 政策 的 服务 和 实 
践 , 黄 如 花 从 科学 元 数据 的 功能 需求 分 析 、 标 准 建设 等 
方面 分 析 了 国内 外 科研 数据 元 数据 的 研究 进展 "1, 杨 
云 秀 、 顾 立 平等 人 也 对 国外 科研 教育 机 构 和 科研 资 
机 构 的 数据 政策 进行 了 分 析 "*“”*"。 研 究 美国 .欧盟 等 
国外 知名 信息 服务 机 构 的 RDM 政策 有 助 于 我 国信 息 
服务 机 构 制 定 更 加 完善 的 数据 管理 政策 。 

近年 来 ,国内 已 有 引领 RDM 服务 的 实践 ,比如 
2011—2012 年 ,在 CALIS 三 期 项 目 建 设 中 ,武汉 大 学 
图 书馆 尝试 开展 了 RDM 服务 :确定 试点 院 系 ,搭建 共 
享 平台 , 并 开始 面向 全 校 提供 数据 存储 和 共享 服 
务 字 下 机 制 和 平台 。 所 取得 的 几 项 研究 成 果 包 括 ; 对 
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比 国外 高 校 的 科研 数据 生命 周期 的 管理 模型 E A 
外 高 校 数据 共享 平台 的 整理 "1 、 国 外 政策 以 及 国内 科 
研 教育 体系 的 科研 数据 服务 发 展 “H、 国 内 高 校 用 户 对 
RDM 的 需求 调查 5 、 武 汉 大 学 图 书馆 在 社会 RDM 75 
面 的 实践 52、 武汉 大 学 图 书馆 实行 RDM 的 案例 分 
HE ,以 及 建立 科研 数据 知识 库 的 经 验 总 结 2 等 。 
由 武汉 大 学 、 中 国 科 学 技术 信息 研究 所 、 澳 大 利 亚 南 
昆士兰 大 学 等 于 2014 年 10 月 26—27 日 联合 举办 的 
COINFO 2014 专门 介绍 了 科研 数据 的 引用 、 发 布 与 共 
享 " ,这些 具体 实践 都 为 我 国信 息 服务 机 构 开 展 
RDM 提供 了 良好 的 基础 。 

RDM 是 解决 科研 成 果 完 整 性 、 科 研 数据 规范 化 问 
题 的 有 效 方 式 ,通过 对 科研 数据 的 管理 ,能 够 提高 研 
究 的 可 见 性 ,促进 学 术 成 果 的 严谨 性 ,提高 研究 的 质 
量 , 通 过 再 利用 提高 资源 的 效率 ,促进 科研 人 员 发 现 
更 多 更 新 更 有 价值 的 问题 ,提高 科学 的 完整 性 以 及 推 
动 科学 的 进一步 发 展 22 。 

中 国 科 学 院 文献 情报 中 心 对 RDM 开展 了 相关 的 
研究 和 实践 。 在 此 基础 上 ,为 积极 面 对 国内 外 的 数据 
管理 政策 变化 ,结合 现 阶段 科研 人 员 的 实际 需求 ,本 
文 从 信息 服务 实践 的 角度 ,提炼 了 DRM 的 政策 要 素 ， 
以 期 为 我 国 的 ROM 政策 制定 提供 参考 借鉴 。 

2 ”信息 服务 机 构 RDM 政策 要 素 的 框架 分 析 

科研 数据 的 管理 更 加 注重 完整 流程 ,从 数据 创 
建 、 存 储 , 到 后 续 的 管理 和 完善 ,直至 实现 科研 数据 的 
共享 ,都 是 RDM 的 内 容 ,如 图 1 所 示 。 
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1 RDM 内 容 框 架 63] 


在 遵循 科研 资助 机 构 与 科研 教育 机 构 的 数据 管 
理 政策 的 基础 上 ,制定 良好 的 RDM 政策 ,人 们 通常 考 


虑 “机 构 要 管理 什么 数据 ,数据 创建 之 后 如 何 进行 存 
储 和 保管 ,才能 在 保证 相关 人 员 权 益 的 同时 实现 数据 
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的 最 大 化 利用 ”, 如果 按照 这 个 思路 对 信息 服务 机 构 
的 科研 数据 政策 进行 分 析 讨 论 , 则 可 进行 研究 提问 : 

提问 1: 管 理 什 么 ? 信息 服务 机 构 要 管理 哪些 科 
研 数据 ? 需要 遵循 怎样 的 规则 ? 

提问 2: 如 何 管理 ? 科研 数据 创建 之 后 ,信息 服务 
机 构 要 如 何 实现 对 这 些 数据 的 保管 .整理 ? 

提问 3 :怎么 使 用 ? 信息 服务 机 构 要 如 何 保障 各 
方面 的 权益 ,从 而 实现 数据 的 最 大 化 利用 ? 

根据 这 三 个 研究 提问 ,借鉴 4 前瞻 导 论 关 ” 的 政策 内 容 
分 析 方 法 , 细 分 为 若干 可 观测 的 研究 问题 ,如 表 1 所 示 。 

信息 服务 机 构 是 负责 收集 、 处 理 、 加 工 信 息 的 机 
构 , 也 是 对 科研 数据 实施 管理 的 机 构 , 主 要 包括 科技 情 
报 所 、 图 书馆 、 信 息 中 心 、 咨 询 公 司 等 ,无 论 是 隶属 于 学 
校 的 图 书馆 ,还 是 专 由 的 信息 服务 中 心 ,其 科学 研究 一 
般 都 受到 科研 资助 机 构 的 资助 ,所 以 信息 服务 机 构 的 
政策 既 要 遵从 科研 资助 机 构 关 于 RDM 的 政策 要 求 ,又 
要 有 自身 独特 的 数据 政策 规定 ,部 分 信息 服务 机 构 的 
科研 数据 政策 还 要 符合 所 在 大 学 的 政策 要 求 。 

以 科技 信息 政策 中 心 编译 的 《欧盟 图 书馆 实施 科 
研 数据 管理 的 案例 汇编 ?为 基础 ,实施 滚雪球 法 ,选取 
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3 信息 服务 机 构 的 科研 数据 存 缴 内 容 要 点 
信息 服务 机 构 支 持 RDM 的 多 重 角色 

在 E-science 环境 下 ,科研 数据 呈现 指数 型 增长 
趋势 "s] 。 图 书馆 能 够 从 不 同 角度 提供 各 种 数据 服务 ， 
Auckland 2 指出 图 书馆 员 能 够 提供 数据 咨询 服务 
数据 分 析 数据 存储 等 服务 ;Anna 也 认为 图 书馆 能 
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表 1 信息 服务 机 构 的 RDM 政策 的 分 析 框 架 


测 问 题 


研究 提问 xi; 
信息 月 


D 
Iw) 
Es 
过 
F 
B 


服务 机 构 来 执行 ,而 不 是 


据 内 容 有 无 明确 规定 ? 
据 格 式 有 无 明确 规定 ? 


perma — 
f 
rn rH 
EE 
BERE] 
B 


如 何 管 ? AS ES 遵循 什 2 ZU 


4J XE. 

9 结构 

813 

9 存储 时 间 有 无 明确 的 
9 存储 位 置 有 无 明确 规定 ? 


2 nca 


研 数据 
斗 研 数 据 
有 无 要 求 


Oo AUNG- 
>H 


1. 科 研 数据 开放 共享 中 ,如 何 保证 数据 产生 者 
怎么 用 2 | 的 权利 ? 

BAR? | 2. 科 研 数据 使 用 许可 有 无 明确 规定 ? 

3. 科 研 数据 的 隐私 保护 是 如 何 规定 的 ? 


ic Publishing House. 


具有 代表 性 和 借鉴 意义 的 10 个 研究 对 象 ,如 图 2 所 
示 。 以 下 简称 剑桥 大 学 图 书馆 (LCAM)、 麻 省 理工 学 
院 图 书馆 (LMIT) .耶鲁 大 学 图 书馆 (LYL)、 纽 约 大 学 图 
书馆 (LNY)、 斯 坦 福 大 学 图 书馆 (LST) 、 约 翰 霍 普 金 斯 
大 学 图 书馆 (LJH) 、 康 奈 尔 大 学 图 书馆 (LC) .伦敦 国王 
学 院 图 书馆 (LKCL) 维也纳 大 学 图 书馆 (LU)、 内 梅 享 
大 学 图 书馆 (LR)。 


` por We http://www.ru.nl/library/services/re 
[ EJ ) search/researchdata/« 
NA ] 


http://phaidraservice.univie.ac.at/e 
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TE E R AGE E EA RU. R TS BR BU XE Vm X RDM 实 
施 .RDM A F 385875 m A 18 E 32 (E FU ; Cox 提 
出 图 书馆 在 RDM 中 扮演 着 政策 和 宣传 .支撑 和 培训 、 
审核 和 数据 库存 储 的 角色 ;Luis 提出 图 书馆 员 在 未 来 
RDM 中 肩负 着 “数据 监管 员 (data curators)” 的 责 

TE? iLyon 将 图 书馆 的 潜在 作用 与 科研 生命 周期 模 
型 进行 映射 ,指出 图 书馆 能 够 在 RDM 中 提供 RDM 收 
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$ . RDM 策划 、RDM 信息 服务 、 科 研 数 据 引 用 、RDM 培 
训 、 科 研 数据 许可 、 科 研 数 据 评 估 、 科 研 数据 存储 、 科 
研 数据 获取 和 科研 数据 影响 力 十 个 层面 上 的 服 
务 呈 人 。 也 正 是 由 于 科研 数据 具有 的 科研 价值 .经 济 
价值 和 社会 价值 ,并 且 是 独一无二 的 ,一 旦 遭 到 破坏 
将 无 法 恢复 ,而 信息 服务 机 构 作 为 信息 的 管理 中 心 ， 
既 能 够 对 数据 资源 进行 标 引 、 分 类 及 整理 ,又 能 确保 
数据 资源 的 安全 性 ,因此 信息 服务 机 构 在 科研 数据 的 
保存 和 利用 方面 具有 不 可 替代 的 作用 。 
3.2 信息 服务 机 构 要 求 作者 提交 的 科研 数据 内 容 
科研 数据 内 容 是 反映 客观 事物 基本 特征 及 其 变 
化 规律 的 原始 基础 数据 。 内 容 包 括 但 不 限于 :调查 
数据 ;名 实验 数据 ;@ 访 谈 数据 ;@ 教 育 数 据 ;工作 
文件 等 。 许 多 大 学 图 书馆 在 进行 RDM 时 都 列举 了 所 
要 存储 的 科研 数据 的 具体 类 型 ,比如 LR 存储 的 科研 
数据 包括 收集 到 的 各 类 数据 (如 访谈 数据 ,视频 数据 、 
调查 数据 .定量 数据 .核磁 共振 数据 .观测 数据 .实验 
Zug), LYL 也 给 出 存储 的 数据 包括 各 种 调查 数 
据 、 模 拟 数 据 、 实 验 数据 和 其 他 可 编译 数据 等 “*]。 
LMIT 管理 的 数据 内 容 包 括 会 议论 文 .图 片 、 预 印 本 、 技 
术 报 告 论文 .工作 文件 .科研 数据 集 等 “1。LJH 也 规 
定数 据 可 以 是 实验 数据 、 观 察 数据 等 ,但 是 数据 内 容 
必须 是 包括 可 以 进一步 使 用 和 评价 的 记录 ,已 发 表 的 
科研 成 果 等 ,无 法 再 进一步 利用 的 数据 是 不 能 被 存储 
的 1。 也 有 一 些 机 构 比 较 特 殊 , 对 数据 存储 内 容 没 有 
特定 要 求 , 如 LU 存储 的 科研 数据 形式 可 以 是 观测 数 
据 、 实 验 数据 、 也 可 以 是 派生 或 衍生 数据 .引用 或 规范 
数据 以 及 生成 数据 , 除 此 之 外 ,还 可 以 有 教学 意义 上 
的 科研 数据 。 
3.3 信息 服务 机 构 对 科研 数据 存储 格式 有 所 要 求 
科研 数据 的 格式 影响 着 其 开放 和 引用 ,是 确保 科 
研 数据 能 够 长 期 获取 的 关键 ,主要 包括 :开放 的 ; 
@ 不 依赖 于 软件 的 ;@ 非 专业 ;@ 未 加 密 ;@ 非 编译 格 
式 等 ,这 种 格式 的 数据 更 容易 被 保存 和 使 用 ,也 不 会 
受到 软件 限制 。 如 LMIT 指出 为 了 保证 科研 数据 能 
在 未 来 一 段 时 间 内 可 以 被 发 现 , 提 出 了 数据 保存 时 的 
优选 格式 一 一 ODF、ASCII.MPEG-4、TIFF 或 JPEG2000 
以 及 XML , LKCL 也 提出 无 论 在 分 析 时 使 用 何 种 格 


式 ,但 是 在 进行 数据 保存 时 最 好 使 用 通用 的 格式 , 尽 
量 不 要 存储 诸如 RTF、Excel、SPSS 这 种 依赖 于 软件 的 
文件 格式 "1。LST 虽然 也 要 求 存 储 开放 格式 的 数据 ， 
但 是 如 果 格 式 转换 会 造成 数据 丢失 , 则 也 可 以 存储 专 
业 格式 及 其 readme. txt 文档 和 相关 读 取 软件 5 。 也 
有 部 分 图 书馆 比较 例外 ,如 LYL 认为 任何 类 型 的 数字 
文件 (录像 、. 文 本、 照片 .数字 等 ) 都 可 以 被 存储 [5 。 
4 信息 服务 机 构 科 研 数据 的 质量 管理 要 点 
4.1 协助 创建 个 人 DMP 

良好 的 数据 管理 计划 (Data Management Plan , 简 
称 DMP) 是 科研 数据 共享 的 前 提 , 它 不 仅 可 以 帮助 科 
研 人 员 管 理科 研 数据 ,满足 资助 者 的 要 求 ,而 且 还 能 
够 提高 资源 的 共享 度 。 因 此 ,很 多 机 构 都 提出 通过 
DMP 来 帮助 科研 人 员 实 现 数据 资源 的 管理 。DMP 的 
内 容 一 般 包括 :项 目 、 实 验 、 数 据 的 描述 ;@ 文 档 、 组 
织 和 存储 ;@ 访 问 、 共 享 和 重用 ;多 归档 等 ”1 ( 见 图 
3) ,如 LMIT、LST、LCAM、LYL、LNY、LC、LJH、LR 等 均 提 
出 需要 清楚 地 描述 科研 数据 的 创建 .内 容 、 管 理 人 员 、 
发 布 . 共 享 权利 、 存 储 位 置 等 相关 方面 的 政策 ,编制 成 
在 线 模板 供 科研 人 员 使 用 , 且 提 供 了 科研 数据 创建 工 
& DMPTool, 帮 助 科研 数据 成 为 现在 和 未 来 可 用 的 最 
EREE, bIh LMIT、LC 等 还 提供 了 DMP 的 实例 
链接 。 
4.2 积极 开展 RDM 的 培训 工作 

图 书馆 员 是 科研 管理 工作 的 主要 执行 者 ,其 对 科 
研 数据 的 认识 程度 直接 决定 了 RDM 工作 执行 的 好 
Xf ,因此 ,很 多 学 校 专 让 开 设 了 培训 课程 ,主要 包括 : 
Q@ 针 对 于 图 书馆 员 的 培训 ,使 其 对 RDM 工作 所 需 的 
专业 技能 有 更 全 面 的 了 解 ,为 科研 人 员 提 供 管理 科研 
数据 的 支持 ;@O 针 对 科研 人 员 及 学 生 的 培训 ,帮助 他 
们 了 解 科研 数据 的 重要 性 ,增强 对 科研 数据 的 认识 。 
LMIT95U 、LCAM | [NYU | LJH” 等 提供 了 各 种 各 
样 的 数据 管理 培训 班 帮助 科研 人 员 学 习 如 何 管理 科 
研 数据 、 如 何 进行 科研 数据 的 文件 组 织 以 及 如 何 进 行 
科研 数据 的 版 本 控制 等 课程 ,所 有 课程 都 可 以 通过 主 
页 进行 查找 。LKCL 也 开设 了 类 似 的 课程 ,除了 提供 
相关 培训 材料 和 课程 时 间 安 排外 ,还 设置 了 课程 反馈 
意见 调查 ,内 容 主 要 包括 "5 :人 你 希望 从 课程 中 学 到 
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什么 ? @ 你 已 经 学 到 了 什么 ? 加 你 还 想 学 习 哪 些 内 


容 ? 纯 你 认为 课程 的 优点 是 什么 ? @ 你 认为 课程 还 
有 哪些 地 方 需要 调整 ? @ 你 愿意 向 其 他 人 员 推 荐 该 
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课程 吗 ? @ 其 他 建议 。LR 建立 了 一 个 专业 科研 数据 
中 心 , 要 求 所 有 员工 都 必须 拥有 RDM 服务 (开发 ) 的 
知识 ,还 专门 为 博士 生 开 设 了 RDM RE, 


麻 省 理工 学 院 图 书馆 


的 个 人 DMP 


图 3 麻 省 理工 学 院 图 书馆 的 个 人 DMP 


4.3 设计 符合 需求 的 科研 数据 元 数据 标准 

科研 数据 元 数据 标准 包括 但 不 限于 "1 :中 标题 ; 
@ 创 建 者 ;@@ 标 识 符 ;@ 日 期 ;名 主题 ;@ 资 助 者 。 由 
于 不 同学 科 特 点 不 同 ,因此 各 信息 服务 机 构 也 都 针对 
自身 特点 给 出 了 不 同 的 元 数据 标准 。LMIT 规定 了 科 
研 用 户 上 传 数据 时 的 元 数据 内 容 ( 见 表 2) ,并 且 建 议 
用 户 在 搜集 和 创建 元 数据 时 应 该 对 数据 产生 、 组 织 以 
及 加 工 过 程 、 缩 写 等 都 做 好 笔记 。 

LYLE: LNY5 LST" 1 等 也 都 给 出 了 科研 数据 上 
传 的 元 数据 描述 标准 ,指出 采取 何 种 标准 依赖 于 数据 
的 类 型 .规模 以 及 所 属 学 科 , 而 LC 还 特别 提供 这 种 说 
明 性 文件 (命名 为 readme) 777, 3H EC PHRA FP BUE 
存储 数据 ,由 图 书馆 统一 管理 下 的 科研 数据 资源 更 加 
结构 化 ,有 利于 储存 .检索 和 挖掘 分 析 等 相关 利用 。 
4.4 规范 化 科研 数据 的 文件 命名 格式 

文件 命名 格式 可 以 反映 文件 的 特征 、 内 容 ,因而 


表 2 LMIT 规定 上 传 的 科研 数据 元 数据 内 容 "*3 
元 素 描述 
标题 | 数据 集 或 科研 项 目的 名 称 
创建 者 | 创建 人 /创建 组 织 的 名 称 和 地 址 
用 于 识别 数据 的 号 码 , 即 使 它 只 是 一 个 内 部 项 目 参 
考 号 码 


标识 符 


日 期 | 仿 数 据 相关 的 关键 日 期 (包括 项 目 起 始 日 期 ,数据 修 
” | 改 日 期 ,发 布 日 期 .时 间 段 ) 


主题 | 数据 主题 或 内 容 的 主要 关键 词 ,短语 
科研 项 目的 资助 机 构 

权利 | 数据 的 知识 产权 

语言 | 可 使 用 的 语言 类 型 

位 置 | 数据 的 物理 位 置 、 空 间 信 息 


方法 | 数据 是 如 何 产生 的 (包括 所 使 用 的 软 硬 件 设备 、 实 验 
A | 协议 及 其 他 内 容 ) 
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需要 有 足够 的 描述 信息 以 识别 数据 文件 。 文 件 命名 包 
括 但 不 限于 :个 项目 缩写 ;@ 实 验 名 称 ;@@ 实 验 位 置 ; 
@ 观 察 员 ;名 观察 年 份 ;@ 数 据 类 型 ;版 本 号 ;@@ 文 件 
类 型 ,同时 为 了 便于 自动 化 处 理 , 文 件 名 中 一 般 很 少 涉 
及 特殊 字符 以 及 空格 ,通常 会 使 用 “一 "或 ““” 来 代替 ， 
比如 LMIT 1 的 其 中 一 种 文件 命名 格式 为 ; 

[type of file] [specimen number]. [ version]. . 
[collector] [ YYYYMMDD ] [geolocation]. [ext] 

比如 蝴蝶 项 目 中 一 张 图片 的 名 称 即 为 image. — 
12345. v1 mcneill 20140117. 42. 3598N71.0921W. tif 

从 这 个 名 称 中 我 们 可 以 清楚 地 看 出 图 片 所 描述 
的 内 容 ,这 对 于 数据 文件 的 归 类 整理 .资源 共享 查找 
都 有 非常 重要 的 作用 。LYLIseJ 、LC55 LST59 等 也 给 
出 了 类 似 的 数据 文件 命名 格式 。 
4.5 协助 设计 合理 的 科研 数据 存储 时 间 

数据 的 存储 时 间 一 定 程度 上 决定 了 数据 的 发 现 
和 访问 服务 ,对 支持 科研 数据 的 生命 周期 具有 非常 显 
著 的 意义 。 存 储 时 间 一 般 包括 :中 有 时 间 限 制 (4 年 7 
年 .10 年 );@ 无 时 间 限 制 (永久 保存 )。 如 LKCL 规 
XE. ,如果 是 由 项 目 资 助 的 已 发 表 科 研 成 果 , 那 么 将 会 
保存 7 年 ,而 未 受到 项 目 资 助 的 ,会 根据 情况 保存 4 
年 ;对 于 没有 历史 价值 且 可 以 二 次 使 用 的 科研 数据 ， 
根据 兴趣 保存 4 年 ,而 对 于 有 历史 价值 的 科研 数据 ， 
则 在 存储 时 要 识别 主题 和 国家 ,具体 时 间 没 有 限 
制 "” 。 也 有 图 书馆 对 所 有 数据 采取 同样 的 保存 期 限 ， 
如 LR 要 求 科 研 人 员 致 力 于 保持 与 他 们 的 学 术 出 版 物 
相关 的 数据 可 获取 的 时 限 至 少 为 10 SEU" ;LU 开发 了 
一 个 系统 Phaidra, 倡导 持续 引用 的 数据 政策 :一 
旦 在 Phaidra 中 ,就 一 直 在 Phaidra FR" , 以 此 来 实现 数 
字 资 源 和 资产 的 永久 托管 .存储 和 索引 9 。 
4.6 建立 数据 知识 库 ,提供 外 部 链接 ,协助 科研 用 户 
存储 科研 数据 

数据 知识 库 的 使 用 可 以 帮助 科研 人 员 管 理 数据 、 
统一 引用 标识 符 、 提 高 数据 的 可 发 现 性 以 及 促进 数据 
的 长 期 保存 。 在 数据 的 存储 位 置 上 ,通常 有 :人 学校 
的 数据 知识 库 ;@ 公 共 数 据 知识 库 , 比 如 LJH, LCAM, 
LU、LST 都 分 别 开 发 了 自己 的 知识 库 JHU Data Ar 
chive"?! , DSpace ¥ £" |u; scholar?" , SDRU? ,鼓励 


师 生 存储 论文 ,科研 数据 等 资源 ,但 是 LCAM 还 建议 
关键 性 的 数据 应 该 存储 在 不 同位 置 而 不 仅仅 是 一 个 
数据 库 中 ”1。LMIT 还 对 数据 类 型 进行 了 区 分 ,其 中 
由 LMIT 和 HP 公司 合作 研发 的 DSpace 平台 、 麻 省 理 
工 与 哈佛 数据 中 心 共 同 研 发 的 DVN 平台 ,就 是 专门 储 
存 学 校 教师 .研究 人 员 、 部 门 、 实 验 室 人 员 的 数字 科研 
成 果 、 教 学 成 果 的 数据 知识 库 ; 对 于 社会 科学 ,可 以 存 
储 在 ICPSR 上 ;此 外 ,图 书馆 还 可 以 协助 科研 人 员 将 
数据 存储 在 DataBib、re3data. org, OAD E", LC 在 
NSF 的 资助 下 ,建立 了 康 奈 尔 地 理 空间 信息 库 (GU- 
GIR) 和 美国 农业 部 经 济 、 统 计 与 市 场 信息 系统 (USDA- 
ESMIS) 两 个 数据 储存 库 , 供 研究 人 员 存 储 、 分 享 和 发 
布 数据 ,在 此 基础 上 ,还 开发 了 数据 阶段 型 存储 库 
(Data staging repository, DataStaR )U9 。 LNYUS, 
LYL'1 等 虽然 没有 专门 的 知识 库 ,但 都 提供 了 不 同学 
科 知 识 库 的 链接 供用 户 参 考 。 
5 信息 服务 机 构 的 科研 数据 开放 共享 的 要 点 
5.1 规范 化 科研 数据 的 引用 格式 

数据 引用 不 仅 指 文献 之 间 的 参考 文献 ,也 可 以 指 
数据 和 文献 .数据 和 数据 集 、 数 据 和 数据 之 间 的 多 重 
X RUD ,这 对 于 提高 科研 人 员 的 个 人 绩效 具有 一 定 的 
影响 。 在 引用 科研 数据 时 ,一 般 包括 :中 作者 ;@ 标 
题 ;@ 出 版 年 ;四 出 版 商 /经 销 商 ;@URL、 标 识 或 其 他 
访问 位 置 等 。 目 前 ,数据 知识 库 往往 赋予 每 个 数据 集 
一 个 唯一 标识 符 (DOI) ,这 个 标识 符 能 够 快速 准确 识 
别 数 据 , 对 于 数据 引用 至 关 重 要 ,部 分 机 构 库 还 提供 
数据 引用 格式 ,供用 户 参考 。 比 如 LMITAU LJH! 的 
社会 科研 数据 服务 (Social Science Data Services ) 指 
出 了 数据 引用 的 意义 ,并 规定 引用 数据 时 必须 包含 作 
者 、 标 题 、 出 版 年 、 出 版 商 / 经 销 商 和 URL、 标 识 或 其 他 
访问 的 位 置 五 项 内 容 , 给 出 了 数据 引用 的 案例 及 其 链 
8 ,LYLP? LO" 等 也 给 出 了 同样 的 数据 引用 格式 , 科 
研 人 员 可 以 参考 给 出 的 格式 实现 对 数据 的 引用 。 
LCAM 以 FAQ 的 方式 介绍 了 数据 的 引用 ,他 们 认为 数 
据 引 用 没有 统一 格式 ,不 同学 科 数 据 的 引用 格式 也 不 
同 ,同时 给 出 了 密歇根 州立 大 学 图 书馆 以 及 LMIT 数 
据 引 用 格式 标准 的 链接 ,供用 户 参考 (2 。 
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5.2 协助 制定 合理 的 科研 数据 使 用 许可 及 使 用 范围 

知识 成 果 的 使 用 权利 必须 通过 一 系列 的 条 件 与 
QR Sl e DL REUS 

在 使 用 许可 上 ,可 以 是 : (D Creative Commons; 
Q)Open Data Commons。 如 LCAM 鼓励 用 户 使 用 
DSpace 平台 上 的 数据 ,为 了 鼓励 对 平台 上 资源 的 再 
利用 ,规定 了 Incremental 和 DataTrain 项 目 上 的 数据 
许可 在 BY-NC-SA-2.0, U.K 之 下 ,PrePARe 项 目 上 的 
数据 许可 在 BY-SA-2.0 IZ FU, 。 对 在 SDR 数据 库 中 
数据 的 使 用 许可 上 ,LST 给 科研 人 员 提 供 了 两 种 选 
择 一 一 Creative Commons (以 CC0 为 主 ,其 他 CC BY 
为 辅 ) 和 Open Data Commons ( PDDL, ODC Attribution 
License, ODbL) ,科研 人 员 可 以 根据 自己 的 意愿 来 选 
REAR FA, LMT 将 数据 分 为 自己 创造 / 搜 
集 的 数据 和 从 其 他 来 源 搜集 的 数据 ,其 中 自己 创造 的 
数据 应 该 遵从 CC 许可 的 规定 ,而 其 他 来 源 数 据 只 能 
用 于 教育 或 科研 使 用 ,而 不 能 作 他 用 "1。 

在 使 用 范围 上 ,可 以 是 :中 机 构 内 部 人 员 使 用 ; 
@ 机 构 以 外 人 员 使 用 。 如 LKCL、LR 等 都 明确 规定 ,作者 
提交 数据 时 ,应 该 标识 出 谁 可 以 获取 及 使 用 这 些 数据 ? 
数据 将 如 何 使 用 的 问题 。LR 还 规定 所 有 发 表 的 科研 数 
据 都 可 以 被 反复 检验 ,数据 资源 是 对 图 书馆 内 所 有 成 员 
单位 (用 户 、 信 息 服务 机 构 ) 共 享 的 ,当然 前 提 是 必须 着 慎 
处 理科 研 数据 和 诚信 学 术 实践 之 间 的 关系 “。LMIT 的 
DSpace 平台 和 DVN 平台 中 的 科研 数据 是 面向 全 世界 用 
户 开 放 的 ,最 大 限度 地 实现 了 开放 共享 。 
5.3 合理 划分 科研 数据 类 型 ,注重 科研 数据 的 隐私 
保护 ,创造 良好 的 保存 环境 

安全 的 数据 保存 环境 是 保证 科研 数据 有 效 传递 
的 重要 基础 。 当 涉及 机 密 数 据 ` 敏 感 数据 或 受 试 者 数 
据 时 ,科研 数据 的 管理 就 变 得 更 加 重要 了 。 数 据 类 型 
一 般 包括 :@ 禁 止 类 数据 ;@ 限 制 类 数据 ;@@ 保 密 类 数 
据 ;@ 公 开 类 数据 。 数 据 的 隐私 保护 一 般 根据 数据 的 
类 型 进行 区 分 ,如 LST 就 把 数据 分 为 了 以 上 4 类 并 提 
供 了 三 种 数据 存储 方式 , Secure AFS 一 一 四 种 类 型 均 
可 存储 ,但 其 中 的 Standard AFS 只 人 允许 存储 公开 和 保 
密 型 数据 ;Secure IGFS 一 一 存储 公开 保密 和 限制 型 
数据 ,Standard IGFS 允许 存储 公开 和 保密 型 数据 ;On- 
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line Archive Storage 一 一 允许 存储 公开 .保密 和 限制 型 
数据 "3 。 在 数据 共享 上 ,要 对 数据 类 型 实施 修改 以 保 
证 数据 能 被 共享 ,同时 鼓励 科研 人 员 保 留 多 个 版 本 的 
科研 数据 ,一 种 是 适合 公开 的 , 另 一 种 是 在 严格 限制 
条 件 下 可 以 展开 进一步 研究 的 5 。 当 涉及 到 人 类 受 
试 者 数据 时 , 共享 将 会 受到 斯 坦 福 机 构 审查 委员 会 
(IRB) 的 监督 ,而 且 对 科研 分 析 工 具 也 有 要 求 ,在 搜集 
和 管理 病人 健康 或 其 他 敏感 类 信息 时 ,只 能 使 用 
REDCap, STRIDE, Qualtrics 三 种 工具 ,Excel 不 能 充当 
搜集 工具 ,只 能 分 析 不 含 个 人 信息 或 匿名 化 的 数 
18079, LKCL 更 是 规定 ,个 人 数据 的 开放 使 用 权利 由 
个 人 来 决定 ,即便 是 学 院 , 也 必须 是 在 非常 必要 的 情 
况 下 才 使 用 个 人 科研 数据 ,并 县 匿名 数据 是 首选 数据 
RE 。 
6 结论 与 展望 
信息 服务 机 构 的 政策 要 素 
综 上 所 述 ,针对 本 研究 所 提出 的 三 个 研究 问题 可 
将 信息 服务 机 构 的 RDM 政策 要 求 归 纳 为 三 方面 : 科 
研 数据 存 缴 内 容 规 范 、 科 研 数据 质量 管理 规范 、 科 研 
数据 共享 规范 ,如 表 3 所 示 。 

信息 服务 机 构 作 为 RDM 的 最 佳 实践 者 ,对 科研 
数据 的 筛选 .DMP 的 制定 .科研 数据 的 描述 与 保存 、 科 
研 数 据 的 共享 与 使 用 都 有 重要 的 指导 作用 ,因此 , 科 
研 信息 服务 机 构 在 制定 RDM 政策 时 ,可 以 增加 与 数 
据 存 缴 、 数 据 质量 、 数 据 共享 相关 的 政策 内 容 。 此 外 ， 
在 政策 制定 上 ,信息 服务 机 构 往 往 还 会 受到 科研 资助 
机 构 和 科研 教育 机 构 的 指导 ,因此 需要 遵循 两 者 在 
RDM 方面 的 政策 。 
6.2 科研 数据 政策 的 制定 需要 从 实践 中 来 ,并 接受 
实践 检验 

本 文通 过 文献 综述 ,采取 合理 竞 替 的 方法 对 国外 
10 个 信息 服务 机 构 的 RDM 政策 要 素 进 行 了 归纳 提 
炼 ,形成 了 初步 的 政策 要 素 ,但 我 国 实践 过 程 中 可 能 
存在 的 问题 还 需要 在 实践 基础 上 对 数据 管理 政策 内 
容 进 行 细 分 和 修订 。 
6.3 未 来 研究 展望 

随 着 信息 技术 的 发 展 ,数据 资源 越 来 越 多 ,数据 
管理 已 成 为 一 种 必然 趋势 。 若 要 激发 科研 数据 的 全 
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X3 国外 信息 服务 机 构 RDM 政策 要 素 


研究 问题 政策 要 素 政策 内 容 提炼 
多 方面 、 多 角度、 多 层次 务 机 构 在 数据 资源 进行 慰 引 、 分 类 及 整理 ,及 确保 数据 资源 的 安全 性 等 
管理 什么 | 支持 RDM Hs GI E IH 经验 
(ERROR | 科研 数据 内 容 的 要 求 | 各 类 可 收集 到 的 数据 (如 调查 数据 \ 实 验 数据 \ 访 谈 数 据 ` 教 学 数据 \ 工 作文 件 等 ) 
规范 ) ' 开放 的 不 依赖 于 软件 的 、 非 专业 、 未 加 密 、 非 编译 格式 (如 ODF, ASCII, MPEG- 
科研 数据 格式 的 要 求 4. TIFF]JPEG2000. XML Š) 7 
协助 创建 个 人 DMP 科研 人 员 提 出 数据 保存 申请 时 ,就 需 提交 DMP, 以 保证 资源 的 管理 和 共享 
c — TABE EDU HERD TER REHA HR HIR S EERE 
de 不 同学 科 设置 不 同 的 元 数据 标准 , 既 可 以 帮助 科研 人 员 详细 了 解 自己 的 数据 ， 
人 驻 可 以 帮助 其 他 研 品 大 员 发 现 并 正确 使 用 及 引用 数据 (如 标题 . 划 是 者 标识 
怎么 管理 | 标准 R .日 期 等 ) 
质量 TUS TREPET 项 
规范 ) 规范 文件 命名 格式 ed 要 有 足够 的 描述 信 Mi 别 数据 文件 (如 页 目 
湾 计 傅 吾 的 科研 数据 存 | 受 数据 类 型 、 资 助 机 构 政策 ,大 学 政策 的 影响 ,数据 存储 时 间 一 般 都 在 4 年 以 上 
SGLEUSAUAIE ,协助 数 | 机 构 数 据 知识 库 或 者 其 他 可 以 存储 并 保证 数据 安全 的 数据 中 心 等 
规范 科研 数据 的 引用 数据 引用 必须 标明 出 处 ,遵守 科研 道德 规范 
如 何 使 用 | 协助 制定 合理 的 科研 数 | 使 用 许可 :参照 各 图 书馆 规定 。 
CAER) 据 使 用 许可 及 范围 使 用 范围 :科研 用 户 的 要 求 为 主 ,知识 库 .学 校规 定 为 辅 
范 ) 
划分 科 缠 数据 关 型 ,注重 | BUS IRA SUL RM GERIT HIT CIR R UT EIL 
隐私 E M EROANSEEEEM BRERBNESEIUSEEEIS 


部 潜力 ,需要 进行 资助 机 构 政策 ,研究 教育 机 构 政策 、 
学 术 期 刊 的 数据 政策 , 力 至 新 兴 的 数据 级 别 计量 (Da- 
ta Level Metric) 等 研究 与 实践 。 

本 文 调研 了 国外 现 有 的 信息 服务 机 构 的 政策 , 形 
成 了 初步 框架 ,未 来 还 需要 在 访谈 科研 人 员 的 基础 上 

一 步 累 积 和 深化 实施 方案 ,包括 《最 佳 实践 》 和 《 信 

息 服务 机 构 的 数据 管理 政策 指南 》 等 的 研究 和 政策 咨 
询 服务 。 若 干 研究 提问 包括 但 不 限于 : 

(1) 如 何 提高 人 们 对 数据 引用 的 意识 ? 激励 科研 
人 员 真 正 地 去 提供 他 们 的 科研 数据 ,是 否 可 以 设立 一 
些小 的 有 激励 性 的 榜样 赋予 科研 人 员 象 征 性 的 奖 
Th ,例如 “每 月 最 佳 数 据 分 享 者 ”? 

(2) 科 研 数据 的 管理 是 为 了 促使 资源 能 够 被 更 多 
的 科研 人 员 发 现 ,进而 产生 更 多 的 科研 成 果 ， x 科 
研 数据 的 价值 如 何 能 够 得 到 体现 ? 是 否 只 能 通过 引 
用 ?又 如 何 使 用 指标 跟踪 数据 的 引用 ?除了 永久 标 
识 符 ,是 否 还 有 其 他 途径 ? 

(3) 如 何 将 RDM 服务 做 入 到 大 学 图 书馆 的 专业 


科研 数据 中 心 ? 如 何 建立 嵌入 到 科研 院 所 或 大 学 的 
基础 设施 ? 如 何 实现 并 提高 RDM BUBRAGXBRÉS ? 

(4) 科 研 数据 的 描述 往往 是 非 规范 的 ,是 否 需要 
建立 术语 服务 器 的 受 控 词 表 供用 户 人 参考 ? 

(5) 在 我 国 现 有 的 科研 政策 体系 下 ,图 书馆 在 数 
据 管 理 中 可 以 发 挥 怎样 的 作用 ?图 书馆 员 呢 ? 如 何 
针对 不 同 的 数据 类 型 及 学 科 特 点 ,制定 不 同 的 数据 管 
理 政策 ? 

目前 中 国 科 学 院 文献 情报 中 心 的 科技 信息 政策 
中 心 已 经 全 文 翻译 了 《机 构 知 识 库 进 行 科研 数据 管理 
的 政策 指南 ?一文 ,而 且 在 2015 年 10 月 预计 将 举办 
第 四 届 中 国 开放 获取 推介 周 ,期 待 有 更 多 同行 对 RDM 
的 共同 研究 与 推进 。 


致谢 :中 国 科 学 院 文 献 情 报 中 心 科 技 信息 政策 中 
心 组 织 编译 了 《欧盟 图 书馆 实施 科研 数据 管理 的 案例 
汇编 》 报 告 并 在 机 构 知 识 库 (Cir.las.ac. cn) 上 开放 
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